生成 AI
en: Generative AI
新たなアイデアやコンテンツ (文章、画像、音声等) を作り出す能力を持つ人工知能 (AI) の一種
「生成」 という言葉は、従来 AI が得意としていた識別タスクとの対比として用いられている
過去の技術の中で生成 AI と関連が深いのは、ニューラルネットワークと深層学習
経緯等
2017 年に Google が開発した Transformer と呼ばれるアーキテクチャがベース
2018 年末に OpenAI が発表した GPT シリーズ
2022 年 11 月に登場した ChatGPT で社会的に注目を浴びた
2021 年の GitHub Copilot が特定分野での生成 AI 活用を示す
2022 年には拡散モデル (Diffusion Model) が登場し、画像生成の分野でも重要な役割を果たすように
代表例
大規模言語モデル (LLM)
ChatGPT、Gemini など
画像生成 AI
生成 AI の学習に必要な要素
大規模データ
モデル: 入力データから適切な出力を導き出すための仕組み (中核が多層のニューラルネットワーク)
具体的なモデル構造はタスクに応じて異なる
画像認識では畳み込みネットワーク、言語生成の分野では Transformer がよく使われる、など
学習の根本的なメカニズムは同じ (入力と目標出力の誤差を計算し、誤差を小さくするようにパラメータを調整)
モデルの情報は論文や Hugging Face にて確認できる
計算資源
大きなモデルのパラメータ更新の計算に GPU を用いることが一般的
CUDA がデファクトスタンダードになっている
GPU クラスタ
大規模モデル学習の特性
スケーリング則 (Scaling Law)
創発現象 (Emergent Ability)
参考文献
AI 白書 2025